A seguir veremos as principais medidas de tendência central, mas antes vale um parênteses …
Medidas Estatísticas Aplicáveis
As medidas de tendência central (média, mediana, moda) e dispersão (variância, desvio padrão, amplitude, IQR) são aplicáveis às variáveis quantitativas.
Para variáveis qualitativas, devemos focar em:
Distribuição de frequências: Contagem de ocorrências em cada categoria.
Gráficos de barras / colunas: Visualização da distribuição das categorias.
Medidas de associação: Como coeficiente de contingência e Cramér’s V para analisar a relação entre variáveis qualitativas.
Medidas de Tendência Central
Média
Imagine que você precisa calcular a pontuação média de satisfação dos clientes. A média é a soma dos valores dividida pelo número de observações.
notas <-c(85, 90, 78, 85, 92, 88)mean(notas)
[1] 86.33333
Mediana
Às vezes, a média pode ser enganosa se houver valores extremos. A mediana é o valor central quando os dados estão ordenados.
median(notas)
[1] 86.5
Moda
Se você quer saber qual pontuação de satisfação é a mais comum, você precisa calcular a moda.
moda <-function(v) { uniqv <-unique(v) freq <-tabulate(match(v, uniqv)) max_freq <-max(freq)if (max_freq ==1) {return(NA) # Se todos os valores são únicos, não há moda } else {return(uniqv[which(freq == max_freq)]) }}moda(notas)
[1] 85
Medidas de Dispersão
Variância e Desvio Padrão
Para entender a variabilidade das pontuações de satisfação, você pode calcular a variância e o desvio padrão.
Variância: Média dos quadrados dos desvios em relação à média